Este documento generado (con script de Rmarkdown) está pensado para comparar dos bases de datos de Airbnb y poder evaluar los métodos de scraping. Puedes ver el script original
Más información sobre el taller Datos de la turistificación en Madrid del proyecto Efecto Airbnb.
¿Qué anuncios tienen en común? ¿cuáles no?
InsideAirbnb tiene 16313 anuncios.
Datahippo tiene 19655 anuncios.
A. InsideAirbnb y Datahippo tienen 14398 anuncios comunes.
B. La InsideAirbnb tiene 1915 anuncios que no están en la Datahippo.
C. La Datahippo tiene 5257 anuncios que no están en la InsideAirbnb.
Hay, por tanto 21570 anuncios (A + B + C) diferentes en total entre las dos bases de datos. Que concuerda con el valor 21570, que son el número de valores de id únicos entre DB1 y DB2.
InsideAirbnb tiene 75.6% de los anuncios combinados de las dos bases de datos.
Datahippo tiene 91.1% de los anuncios combinados de las dos bases de datos.